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В данной работе вводится понятие нового термина критерия поиска информации «социальный индекс», 
главной задачей которого является вычисление значимости любого \М!еБ-документа для конечного 
пользователя в зависимости от его текущих интересов. Методика его определения и применения при 
создании независимых поисковых систем рассмотрены в данной статье. 
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У данйй робот! вводиться поняття нового термйна критерю пошуку 1нформанй — сощальний 1ндекс. Його 
головним завданням е — обчислення важливост! будь-якого \/еБ-документа для кинцевого користувача в 
залежност! вд його поточних 1нтересв. Методика визначення та застосування сощального 1ндексу при 
створенн! незалежних пошукових систем розглянут! в текст! дано] статт1. 
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Введение 


Всемирная сеть предоставляет каждому человеку возможность в самореализации, 
вовлекая тем самым все больше новых пользователей. А с возникновением социальных 
сетей появилась возможность не только постоянно общаться в режиме «оп-Ппе», но и 
обмениваться разного рода информацией и данными. При этом социальным сетям с их 
техническими и научными возможностями не уделяется должного внимания. 

Цель работы. Основной целью данной статьи является введение нового критерия 
поиска по социальной направленности искомой информации. Под социальной на- 
правленностью понимается предрасположенность определенной категории людей к ин- 
тересующей их информации. В данной работе предложенный критерий будет назы- 
ваться социальным индексом. 
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Постановка задачи. Предлагается разработать интеллектуальную систему извлече- 
ния знаний из сети Пщегпеф, которая будет предлагать пользователю УеБ-документы 
по искомой им тематике, на основе их популярности у других пользователей, со 
схожими с ним интересами. При этом популярным будет считаться тот электронный 
документ, на который подписалось (выбрали как основной источник информации) 
наибольшее количество пользователей. 


Анализ последних исследований и публикаций 


В рамках исследуемой предметной области можно выделить следующие ра- 
боты, посвященные поиску информации на основе построения социальных связей 
между различными пользователями сети Пиегпее: 

1. Оп 4езюпше ап ппретепипе а соПаБогайуе зубет изше фе 4101 шмед-обесе 
тшоде! оЁ Тауа ВМТ [1]. 

2. РгоЙПпе ап тасытакте $гаес1ез ш зиррой оЁ оррогип1$Яс соПабогайоп [2]. 

3. Кесоттепате соПабогайоп \и зос1а! пебуогК$: А сотрагануе еуашаНоп [3]. 

4. Зос1а! песуогК$ ап Зосла| топтайоп НПепп? оп Оо [4]. 

В первой работе проблема поиска пользователями интересующих их данных 
решается путем создания общего хранилища информации. При этом каждый пользо- 
ватель данной системы формирует свои ограничения (фильтры) на искомые им доку- 
менты. Тем самым определяется список свойств, характеризующий искомую инфор- 
мацию, который в свою очередь может быть расширен за счет фильтров, заданных 
другими пользователями. В результате точность классификации любого документа, 
хранимого в данной системе, повышается. 

Основные достоинства данной системы: 

1. Организация единого независимого хранилища документов по искомым поль- 
зователям тематикам. 

2. Улучшенная точность классификации документов в рамках сформирован- 
ного хранилища. 

3. Использование фильтров, созданных различными пользователями в рамках 
единой среды. 

Недостатки данной системы: 

1. Отсутствие критерия проверки корректности задания пользователем фильтра 
для поиска интересующих его документов. 

2. Чувствительность системы к программному обеспечению компьютера поль- 
зователя. 

3. Размер хранилища ограничен документами пользователей, которые зарегистри- 
рованы в системе. 

4. Система работает только с зарегистрированными пользователями. 

5. Эффективность системы зависит от общего количества пользователей, их 
честности и объективности. 

Во второй работе рассмотрена проблема организации обмена информацией между 
различными пользователями со схожими интересами в любых предметных областях. 
Это задача решается путем создания мультиагентной системы. 

С помощью данных агентов, для каждого пользователя формируется индиви- 
дуальный профиль, в котором хранится информация, заполненная им, а также те данные, 
которые были получены в процессе анализа его активности во время работы с данной 
системой. Для этого каждый пользователь должен создать свою рабочую среду (в 
рамках одной исследуемой им предметной области), в которой он указывает свои пер- 
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сональные данные (е-таП, ФИО, контактный телефон, свои интересы и т.д.), рабочие 
проекты и сопутствующие документы или ссылки на \еБ-ресурсы. Эта информация 
будет составлять основу его индивидуального профиля. Затем данная система про- 
анализирует полученные данные и выделит список основных ключевых слов, которые 
встречаются в текстовых ресурсах, указанных пользователем. В дальнейшем это по- 
зволяет находить новые документы, с которыми работали другие пользователи, на ос- 
новании совпадения основных ключевых слов, характерных для активной в текущий 
момент рабочей среды. Также в процессе работы пользователя с различными докумен- 
тами в рамках одной активной рабочей среды формируется рейтинг наиболее активно 
используемых источников информации (документов, \!еБ-ресурсов). Исходя из этого, 
составляется список наиболее популярных источников для каждого пользователя в 
рамках одной рабочей среды. 

Обмен данными между пользователями осуществляется на основании схожести 
предметной области их рабочих сред. Он выполняется путем равносторонней отсылки 
документов или ссылок на У!еБ-страницы, которые отсутствуют у одного из пользова- 
телей. В дополнение к обмену информацией системой предусмотрены основы коммуни- 
кации по средствам текстовых сообщений между пользователями со схожей предметной 
областью исследований в рамках активной рабочей среды. 

Основным достоинства данной системы: 

1. Механизм обмена данными между пользователями. 

2. Возможность коммуникации пользователей с общими интересами. 

3. Автоматическое обновление профиля пользователя в процессе работы в рас- 
сматриваемой системе. 

4. Возможность пользователя создавать несколько рабочих сред для каждой 
предметной области. 

5. Организацию рейтинга популярности документов для каждого пользователя 
в рамках активной рабочей среды. 

Основные недостатки данной системы: 

1. Система ориентирована на закрытые социальные группы в рамках одной 
организации с ограниченным документооборотом. 

2. Требует установки специального программного обеспечения, которое нуждает- 
ся в предварительной настройке. 

3. Одновременно пользователь может работать только в одной рабочей среде. 

4. Рабочие среды, в которых работает пользователь, никак не связаны между 
собой. 

5. Система не хранит полнотекстовые копии \/еЪ-ресурсов, которые в своей 
рабочей среде отметили пользователи. В результате возможно появление ссылки на 
не существующий ресурс. 

В третьей работе рассматривается проблема обмена информацией между 
пользователями, которые объединены в социальную сеть в рамках одной органи- 
зации. Для этого проектируется соответствующая система, в которой путем опроса 
пользователей оценивается эффективность установления ограничений на обмен 
информацией между различными организационными структурами в рамках одной 
организации. Таким образом, было выявлено, что для самих пользователей приори- 
тетным является получение необходимой информацией в сжатые сроки от источника, 
которому он может доверять в независимости от его месторасположения в иерархии 
системы. Сам же механизм поиска авторитетного ресурса должен основываться на 
наличие доступных ресурсов и опыта разработчиков системы. 
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Основные достоинства данной системы: 

1. Быстрый обмен знаниями между пользователями по интересующим их вопро- 
сам в рамках одной организации. 

2. Наличие возможности коммуникации между пользователями с общими ин- 
тересами. 

3. Возможность решать трудные задачи коллективной работой пользователей. 

Основные недостатки системы: 

1. Система ориентирована на закрытые социальные группы в рамках одной 
организации с ограниченным документооборотом. 

2. Слабо развит документооборот между пользователями. 

3. В системе не предусмотрено общеё хранилище документов. 

4. При выполнении коллективных задач затруднена оценка степени участия 
каждого отдельного пользователя. 

5. Отсутствует механизм поиска информации по ключевым словам внутри системы. 

В четвертой работе рассматривается проблема выявление значимых данных 
для конечного пользователя на базе информационного ресурса П1ох [5]. 
Данный ресурс представляет собой динамическую У!еЬ-страницу, на которой каждый 
зарегистрированный пользователь может оставить ссылку. Также он может проголо- 
совать за другие источники информации, добавленные остальными пользователями 
системы. При этом любая новость на ресурсе П1е> может быть прокомментирована 
зарегистрированным пользователем. В результате на первой У\еБ-странице данного 
ресурса отображаются источники информации с наибольшим рейтингом. Для персо- 
нализации данной странички разработчики системы предлагают пользователям объе- 
диняться в социальные подгруппы, в рамках которых рейтинг отмеченных ими ссылок 
выше, чем остальных. Таким образом, осуществляется попытка уменьшения эффекта 
влияния на рейтинг наиболее активных пользователей системы, которые часто его 
неоправданно завышают для некоторых источников информации. 

Основные достоинства данной системы: 

1. Постоянное обновление ресурса за счет добавления новых источников раз- 
личными пользователями. 

2. Индивидуальный расчет значимости источников информации за счет объе- 
динения пользователей в социальные группы. 

3. Реализация концепции У!еб 2.0 (каждый пользователь может в режиме 
реального времени дополнять \еБ-ресурс новой информацией). 

Основные недостатки системы: 

1. Отсутствует механизм деления пользователей по интересам, который мог бы 
улучшить объективность рейтинга источников информации. 

2. В системе нет функции пополнения данных за счет интеграции с другими 
ресурсами. 

3. Ограниченность системы. Она ориентирована на работу только с новостными 
ресурсами. 


4 Система поиска информации 
на основе социального индексирования 


4.1 Конструктивные особенности 


Исходя из проделанного анализа основных наработок выполненных В данной 
предметной области было принято решение: разработать специализированную поиско- 
вую систему, которая должна обладать следующим конструктивными особенностями: 
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1. Учитывать основные интересы пользователя при поиске нужной ему инфор- 
мации. 

2. Сортировать найденную информацию в соответствии с текущими интере- 
сами пользователя. 

3. Оценивать привлекательность \\еБ-ресурса для конечного пользователя. 

4. Работать с различными ресурсами сети Пиегпеь доступ к которым имеет 
любой пользователь. 

5. Реализовывать основные преимущества концепции У!еЬ 2.0 (возможность 
оценивать и комментировать прочитанные источники информации) и \\еБ 3.0 (поиск 
источников информации на основе их семантики). 

6. Объединять пользователей из различных социальных сетей на основании 
общих тем. 

7. Использовать профиль пользователя в социальных сетях для автоматического 
заполнения регистрационной формы. 

Таким образом, для выполнения описанных выше конструктивных особенно- 
стей было принято решение о создании системы, способной выполнять поиск инфор- 
мации, основываясь на собственном критерии оценки данных — социальном индексе. 
Он будет определять степень важности информации в зависимости от текущих 
интересов пользователя. 


4.2 Алгоритм работы 


Общий алгоритм работы системы поиска информации на основе социального 
индекса представлен следующей блок-схемой (рис. 1). 

Данная структурная схема выступает в роли опорного плана взаимодействия 
пользователя и системы, основанной на методе поиска информации по социальному 
индексу. В ее основу включены основные функциональные элементы, которые 
посвящены главным образом регистрации нового пользователя в системе. На этом 
этапе, помимо указания личных данных о себе, пользователь может подключить К АЕ- 
файл своего социального профиля (при его наличии), составленного в соответствии 
со стандартом Зетапис У\еБ ЕОАЕР [6]. Также существует возможность установки 
специально разработанного плагина. Он выполняет две основных функции: 

1. Позволяет пользователю отслеживать все актуальные изменения в системе 
(доступ к интересующей его информации по «клику»). 

2. Позволяет системе постоянно обновлять свою базу знаний путем мони- 
торинга активности пользователя сети Пуегпее (плагин передает адреса \\еБ-страниц, 
которые посещались, из которых считывается название и список основных ключевых 
слов, взятых из теа-данных). 

После активации учетной записи пользователь переходит на специально со- 
зданную для него \еБ-страницу, где он может просмотреть список наиболее по- 
пулярных источников среди пользователей со схожими интересами. Результат пред- 
ставляется в виде динамической таблицы, в которой указывается тематика и перечень 
востребованных источников с указанием их описания и ссылкой для перехода. 
Также существует возможность поиска нужной информации по всей базе знаний 
системы с указанием ключевых слов. В этом случае схожесть интересов различных 
пользователей не учитывается. 
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агрузка стартовой Ууер-страницы 
системы пользователем 


Проверка наличия 
‘учегной записи 


Заполнение регистрационной формы 


Запрос на наличие учетной запис” 
в социальной сети 


Проверка корректности ввода данных 
регистрационной формы пользователя 


Запрос на установку плагина 
системы 


Иодключение файла социального 
профиля 


Да 


Инициализация персональных данных 
пользователя в системе 


Загрузить список наиболее 
популярных источников 


Выполнить поиск источников по 
ключевым словам 


Да 
у 


Нет 
Загрузка цанных из Базы знаний на 


персональную \!еб-страницу пользователя 


Закрытие пользователеу основной \еВ- 
страницы системы 
Рисунок 1 — Общий алгоритм проектируемой системы 


4.3 База знаний 


Роль основного хранилища данных в разрабатываемой системе поиска инфор- 
мации на основе социального индекса выполняет база знаний. Она представлена 
онтологией, которая хранится в виде О\!Т-файла. Основные принципы её органи- 
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зации для создания базы знаний интеллектуальных систем изложены в статье, посвя- 
щенной соответствующей тематике [7]. В базовой версии она состоит из трех основных 
терминов: Озег (Пользователь), П\(еге$ (Интересы пользователя) и \Меб$ оигсе (Название 
страниц, которые посещал пользователь), взаимодействие которых показаны на рис. 2. 


Сотаст$ : ия 
1ттегезё : ёегз{5 
\МеБ\у ви : У еБ$оиг5е 


Базиегез{ 


Пиетез@Чате : затар 


МааштЮптаной : зая 
Кеу\огаз : чае 
\!еБА4гез$ : пт? 
Г.оса1А4ге$ : зто 


МагК : пи 


Рисунок 2 — Основные термины базовой версии онтологии 
рассматриваемой системы 


Главный принцип работы рассматриваемой базы знаний заключен в следующем: 

1. Данные, полученные после регистрации пользователя, поступают в термины 
«Озег» и «Пиегез(5». При этом в первом хранится общая информация о пользователе 
(ФИО, возраст, е-та! и т.д.), а во втором — содержится наименование основных его 
интересов (выбранных из предложенного списка при регистрации). Эти термины 
связаны между собой свойством пази(егез{$, с помощью которого элементы Ши\егез{5 
являются частью Озег. 

2. В термин «\МеБ$оигсе» данные поступают из плагина, который закачивается 
пользователем при регистрации. Они представляют собой ссылки на посещяемые им 
УеБ-страницы, а также информацию, полученную при анализе их НТМГ-кода. \еБ- 
Зоигзе также связан с термином «Озег» свойством Ваз \У1з\УеБЗоигзе по аналогии с 
термином Пиеге$ 5. 

3. После накопления данных, полученных от пользователей системы, они могут 
быть выведены из базы знаний в соответствии со сформированным запросом. 

Если основная функция базы знаний в системе поиска информации на основе 
социального индексирования заключается в основном только в хранении/выводе 
информации, то с основной задачей определения степени значимости для каждого 
пользователя справляется метод социальной оценки У’еБ-документов, описанный 
ниже. 


4.4 Метод социальной оценки У\еБ-документов 


Данный метод позволяет вычислить оценку значимости (социальный индекс 51) 
У\еБ-документа для каждого пользователя системы поиска информации на основе со- 
циального индексирования. Для этого используются значения соотношений общего 
количества к количеству посещений пользователей с определенной группой интересов 
СИ с диапазоном значений [0..1] при условии СИ Е К . Также при расчете социального 
индекса учитывается средняя оценка привлекательности У!еБ-документа МИ с диапа- 
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зоном значений [0..10] при условии МИ = среди пользователей со схожими интере- 
сами. Данная оценка выставляется с помощью использования установленного плагина 
системы. 

В результате оценка значимости 5! любого источника, информация будет состоять 
из двух независимых друг от друга параметров. Но для того, чтобы вычислять со- 
циальный индекс для каждого \УМеБ-документа максимально объективно, необходимо 
задать значения некого шаблона, у которого значения СИ и МИ максимальны и равны 
Ти 10 соответственно. В этом случае, чем ближе к нему источник информации, тем 
выше у него 5Г. Исходя из этого, взяв за основу запись Евклидового расстояния для 
сравнения объектов с двумя независимыми параметрами [8], социальный индекс будет 
вычисляться по следующей формуле: 


51. = (МИ, -МИ.)*+(С0,-С0, (1) 


где 51, — социальный индекс 1-го \еб-документа; 

МО, - оценка значимости шаблона (всегда максимальна); 

МО; - средняя оценка значимости 1-го УеБ-документа среди пользова- 
телей со схожими интересами; 

СИ, — соотношения общего количества посещений шаблона к количеству 
посещений пользователей с определенной группой интересов (всегда максимально); 

СИ; — соотношения общего количества посещений 1-го \еБ-документа к 
количеству посещений пользователей с определенной группой интересов (всегда 
максимально). 

Основываясь на полученной формуле социального индекса, основные действия 
работы метода социальной оценки У!еЬ-документа буду состоять из следующих шагов: 

1. Получение списка текущих значений МИ; и СИ; для 1-го УМеБ-документа 
(из базы знаний), поставленных пользователями с различными интересами. 

2. Выбор значений параметров МИ; и СЦ; ‚ установленных для пользователей 
с определенным типом интересов. 

3. Расчет социального индекса для 1-го У\УеБ-документа согласно формуле (1). 

4. В случае открытия 1-го У/еБ-документа пересчитать значение СИ; по всему 
списку значений с учетом списка интересов пользователя, загрузившего его, и 
записать его в базу знаний системы. 

5. В случае оценки 1-го У\!еБ-документа пересчитать значение МИ; по всему 
списку значений с учетом списка интересов пользователя, отметившего его, и за- 
писать его в базу знаний системы. 

Таким образом, по запросу пользователя к системе поиска информации по 
социальному индексу, будет выведен список \УеБ-документов, в порядке их 
соответствия его текущим интересам. 


Выводы 


В данной работе предлагается новый критерий поиска информации — социальный 
индекс. Он позволяет оценивать значимость \еб-документа в зависимости от текущих 
интересов каждого пользователя. Таким образом, ресурсы сети Пиете могут быть 
проиндексированы не только по ключевым словам, но и по принадлежности их к 
определенной социальной группе людей, к примеру, фанатам спорта (футбола). В ре- 
зультате формируется новая социальная сеть, в которой связаны между собой пользо- 
ватель, его интересы в различных предметных областях и \еБ-документы, соответст- 
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вующие этим интересам. Эта особенность выгодно отличает предложенную систему 
поиска информации на основе социального индексирования от схожих решений других 
авторов, рассмотренных выше в статье. 

В дальнейшем планируется практическая разработка предложенной в статье си- 
стемы с последующим сравнением эффективности её работы с другими аналогами, а 
также улучшение механизма интеграции социального профиля пользователя в базу 
знаний предлагаемого решения. 
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зона таехте ор Теб-Роситеп!5 юг Зетапис 5еагсй 
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зреслаПу 4ез1епе@ теазиге, 1.е. а зосла! шаех. $ таш {азК Чес]агез Фе питепса! 
еалуаеп( оЁ з1етЙсапсе Деотее оР апу УеБ-4оситепЕ атоп® изег$ уф Чегет 
Ш1егез(. ТЬ1$ уаше 15 сасшае4 атс а зреслаПу 4ез1епе4 Гога слуеп т Фе (ехё. 

'ТБе ргорозе4 зуу$ет зсВете соп5$1${$ оЁ о рагб. 

Тре Аг$ё ра соп$155 оЁ Фе УеБ-зегулсе ргоэтат, у св аПо\з$ гесл%еге4 изег$ {0 
зеагсВ шТогтаноп Бу Кеу \ог4$ ог из $осла| шаех. ТВе гези(5 оЁ фе Йгз( опе сап Бе 
ое ассог4т> 1ю Феи: дестее о{ ппропапсе {0 изегз ми зипПаг ищегез{5. 
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Тре зесоп рай оНегз Фе изег №ю ша а рот аииие Фе ргосезз оЁ Фе 
тес15тайоп, у1сВ ашотайсаПу Би 4$ шо 1$ Бго\узег. Ц аПо\$ изегз {0 се т геа|-ите 
тоде Фе 1а{е5 шРоптайоп Нот Фе УУеБ-зегусе зузет (ог ехатр!е, Фе п10$ё роршаг 
5Цез атоп> апоШег изег$ \уВо Вауе сотитоп и\{егез{5 узи Бит/Вег), ап © еуаае апу 
ог Фе У!еБ-доситеп 5 оп Фе Пиегпев, \умсВ Бе/$Ве геа4. Апофег Рлпсйоп оЁ Фе ре 15 
о еп шоптайоп о Фе зу$ет зегуег \/Ий регил1$$ 101$ оЁ Фе изег абоцё фе У\еБ-разе 
(пате, а4Чгез$ ап ес.), \мсЬ Бе/зБе у1зпеа. 'Тб1$ шогпайоп 1$ зе {0 сасище Фе 
зоста| шдех апа ирдайе Фе зует Кпо\е@ее Базе. 

Тре гесл$ганоп оЁ а пе\ чзег ш Фе зует сап Бе ре{опте аиютайсаПу № 
615$/рег ассочпЁ ш апу оЁ Фе зосла| пебуогК$ сотрИе ассог4ате 10 ЕОАЕ (\ЗС 
запаага). 

А$ а геза, Фе Нпа! тоде] ог Фе зует сап ш4ех Фе Пиегпее гезоигсе$, по оШу 
Бу Кеу\ога$ Биё а!5о Бу Фет Беаопеше © а рагасийаг зосла| отоир оЁ реоре, г 
ехатрИе, Рап$ оЁ зроп$ (ГоофаП). 'ТБи$, а пе\у зосла! пебмогК 15$ сгежме4, ш \сь аП изегб, 
Бег п(еге$(5$ ш АШегепе Не14$ апа УУеБ-доситеп$ ге]ае {о еасВ ошфет. 
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